首页> 外文OA文献 >H-word: Supporting job scheduling in Hadoop with workload-driven data redistribution
【2h】

H-word: Supporting job scheduling in Hadoop with workload-driven data redistribution

机译:H字:通过工作负载驱动的数据重新分配支持Hadoop中的作业调度

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Today’s distributed data processing systems typically follow a query shipping approach and exploit data locality for reducing network traffic. In such systems the distribution of data over the cluster resources plays a significant role, and when skewed, it can harm the performance of executing applications. In this paper, we address the challenges of automatically adapting the distribution of data in a cluster to the workload imposed by the input applications. We propose a generic algorithm, named H-WorD, which, based on the estimated workload over resources, suggests alternative execution scenarios of tasks, and hence identifies required transfers of input data a priori, for timely bringing data close to the execution. We exemplify our algorithm in the context of MapReduce jobs in a Hadoop ecosystem. Finally, we evaluate our approach and demonstrate the performance gains of automatic data redistribution.
机译:当今的分布式数据处理系统通常遵循查询传送方法,并利用数据局部性来减少网络流量。在这样的系统中,数据在群集资源上的分配起着重要的作用,如果歪斜,则会损害执行应用程序的性能。在本文中,我们解决了使集群中的数据分布自动适应输入应用程序所施加的工作量的挑战。我们提出一种名为H-WorD的通用算法,该算法基于资源上的估计工作量,提出任务的替代执行方案,并因此确定输入数据的先验传输,以便及时使数据接近执行。我们以Hadoop生态系统中的MapReduce作业为例来说明我们的算法。最后,我们评估了我们的方法并演示了自动数据重新分配的性能提升。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号